ANAIS :: ENAMA 2014
Resumo: 235-1


Poster (Painel)
235-1Reconstrução dos genomas de bactérias termofílicas presentes no metagenoma de uma compostagem
Autores:Lemos, L.N. (USP - Universidade de São Paulo) ; Silva, G. (USP - Universidade de São Paulo) ; Antunes, L. (USP - Universidade de São Paulo) ; Quaggio, R. (USP - Universidade de São Paulo) ; Silva, M. (USP - Universidade de São Paulo) ; Setubal, J. (USP - Universidade de São Paulo)

Resumo

Novas aplicações computationais têm sido desenvolvidas para o recrutamento de genomas completos ou parciais de amostras de metagenomas. Essas técnicas são baseadas no agrupamento de contigs por características da composição de sequências. Uma das principais limitações dessas técnicas é que as aplicações são restritas a ambientes com baixa diversidade (e.g., consórcios microbianos). O objetivo deste trabalho foi desenvolver um pipeline computacional para o recrutamento de genomas microbianos de organismos dominantes presentes em ambientes com alta diversidade. O recrutamento de sequências específicas consistiu em mapear as sequências do metagenoma contra genomas de referência. Apenas as sequências paired-end que alinharam uma única vez, em um único genoma, foram utilizadas nas etapas sequintes. As sequências de cada genoma foram montadas em contigs. Os genomas recrutados foram submetidos no sistema de anotação automática RAST. Para testar a nossa abordagem foi utilizado um conjunto de dados de metagenoma da compostagem do Parque Zoológico de São Paulo. Foi possível recrutar 2.818.034 sequências únicas em sete genomas de referência. As espécies mais abundantes foram Thermobispora bispora, Rhodothermus marinus e Thermobifida fusca, tendo mais de 80% dos genomas recrutados. A validação de montagem e anotação foi realizada pela identificação de genes marcadores de cópias únicas. Nos genomas das três populações microbianas com maior abundância, o número de genes relacionados ao processamento de carboidratos foi relativamente alto (aproximadamente 15%). Sendo a primeira ou segunda sub-categoria mais abundante. Foi realizado uma análise comparativa entre uma sequência completa de endoglucanase (GH9) recrutada das populações de T. fusca do metagenoma da compostagem com a sequências de referência do genoma da T. fusca XY. A sequência ortóloga do metagenoma da compostagem apresentou 96% de identidade . Regiões específicas dos genomas de referência não foram mapeadas. Ainda não analisamos essas regiões de baixa cobertura, mas uma das hipóteses possíveis pode ser a presença de Ilhas de Metagenomas. Nossa hipótese é que essas regiões também estão associadas com divergências entre o genoma de referência e o genoma de nossas amostras, podendo ser indicativo de novas cepas. A recuperação completa de ORFs associadas com a degradação de biomassa indica o papel ecológico e funcional dessas populações durante o processamento da compostagem.


Palavras-chave:  Bioinformática, Ecologia Microbiana, Metagenômica, Cellulase, Compostagem